Obiettivi di Apprendimento
- Valutare l'efficienza del modello di esecuzione SIMT su carichi di lavoro paralleli
- Identificare i colli di bottiglia prestazionali legati alla divergenza di ramificazione e alla serializzazione
- Analizzare le tecniche di nascondimento della latenza della memoria all'interno della pianificazione dei warp
- Calcolare metriche di utilizzo e occupazione per i kernel GPU